Análise Exploratória de Dados: Metacritic - Melhores Jogos de Todos os Tempos

O Metacritic é conhecido por ser um site com uma crítica excelente aos jogos que também faz críticas a outros temas como: filmes/séries, músicas e shows de TV. Nele podemos ver reviews de revistas ou sites da crítica que compõe uma nota final conhecida como Metascore, e notas e reviews de usuários que formam o Userscore, e estes determinam se tal filme, série ou jogo "está bem na fita" como esse do GTA Trilogy que virou até meme por está em uma das piores notas de todos os tempos para jogos.

Melhores jogos de todos os tempos

Em uma das abas do Metacritic há um ranking por Metascore de Jogos, e é onde estão os jogos de pelo menos 7 reviews dos críticos1 no site. E lá podemos observar os melhores, os mais clássicos, os mais atuais, e os piores.
Para fim de projeto irei analisar esse ranking tirando proveito das ferramentas do Python: Pandas e Plotly

Ao examinar como o Metascore é feito, o metacritic divide o Metascore em 3 tipos:

Mas para ser mais preciso, é assim que os pontos são organizados:

Let's Analyze

O que podemos tirar de proveito desse dataset? Elaborei algumas perguntas para nosso EDA(Exploratory Data Analysis) Link para o Download do Dataset

Antes disso, vamos saber como nossos dados estão organizados

Não há valor nulo em nosso dataset, Release Date está em datetime64, e nosso dataset está pesando ~600KB em nossa máquina. Agora podemos ver um resumo estatístico das nossas colunas númericas, Ranking e Metascore

Podemos ver que para Ranking há medidas estranhas, pois são todos únicos. Podemos provar da seguinte forma.

Podemos observar que cada valor é único pois sua soma dá o tamanho das linhas dentro do dataset.

Podemos também subdividir os pontos(scores) em bins/buckets em tipos de metascores, como vimos lá em cima

E também criar uma coluna de cores, para identificar cada tipo de pontuação(Boa, Média ou Ruim)

Vamos analisar mais a fundo

A plataforma de PC é a mais popular, e entre os primeiros 5 há o clássico Xbox 360 com mais de 1600 jogos. O Stadia é o que menos contando com 5 jogos, e entre as últimas 5 plataformas, estão os mais recentes: Xbox Series X com 97 jogos, e PlayStation 5 com 153 jogos.

A maioria dos jogos avaliados pela crítica concentram-se entre 2016 a 2020.

Os jogos mais antigos avaliados são da plataforma de: PC, PlayStation(PS1) e Nintendo 64

PC continua reinando, mas com eles, os jogos da nova geração Switch, Xbox Series X e PlayStation 5

Podemos ver que são poucos os jogos abaixo de 19 Metascore, mas há muitos que chegam a ser considerados jogos ruins para a crítica. Variando um pouco em anos e plataformas. Ficando claro que são poucas exceções de bons jogos.

Data visualization

Com o data visualization podemos entender melhor nossos dados visualmente, interpretando-os melhor, e tirando conclusões mais concissas e completas.

As avaliações médias/mistas são levemente proporcionais às avaliações altas por plataforma, tendo algumas exceções de avaliações baixas. PC é a plataforma com mais avaliações de jogos, sendo muitas delas médias/mistas e altas. Já em plataformas de video games, PS4 é o maior. Também com um grande número de avaliações, temos os clássicos: Xbox 360 e PlayStation 2 sendo um dos maiores presentes no ranking por plataforma, porém tendo mais avaliações medianas do que boas.

O gráfico mostra que há mais avaliações boas e médias/mistas, do que ruins. Pode-se interpretar também que depois do ano de 2015, as avaliações ruins ficaram menores em comparações com os anos anteriores, além de ter um aumento significativo de números de jogos entre esses anos(2015-2020).

Conclusão

Nessa análise fiz o uso da ferramenta Pandas, mostrando na prática como ela pode ser usada: subdivisão em bins/buckets, queries para trazer dados mais específicos; descrição estatística dos dados; informações técnicas dos dados; o uso do groupby para organização com o objetivo de visualizar melhor os dados, etc.

Usei a lib de gráficos interativos Plotly para visualização dos nossos dados.

Observamos como é organizado o sistema de Metascore no site Metacritic, a quantia de jogos presentes no ranking, o número de avaliações por Metascore(Boa, Média, e Ruim) e o número de jogos e avaliações organizadas por ano.E Então podemos concluir que se tivermos uma empresa em que precise saber em qual plataforma deve fazer um jogo: essa plataforma é o de PC, sendo a mais avaliada. Também podemos concluir que a crítica contribuiu mais em avaliações nos anos de 2016 a 2020 do que nos anos anteriores, passando de 1000 avaliações, podendo ser por conta da crescente número de jogos desenvolvidos depois de 2015, e o aumento de qualidade destes.

Referência